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摘要 : 【 目的 ] 通过 对 网 络 游记 进行 情感 分 析 , 发 现 游客 对 旅游 地 情感 倾向 的 时 间 分 布 规律 。[ 应 用 背景 】 越 来 
越 多 人 通过 浏览 大 量 网 络 游记 来 收集 信息 ,制定 旅游 计划 。 网 络 游记 成 为 旅游 者 搭配 旅游 地 及 出 游 时 间 的 重要 
参考 内 容 , 也 为 商家 提供 了 商机 。[ 方法 】 提出 面向 网 络 游记 时 间 特 征 的 情感 分 析 模型 ， 分 析 游 客 情感 的 时 间 变 
化 规律 。 该 模型 包括 5 个 模块 : 网 络 游记 文本 内 容 及 旅游 时 间 数 据 的 采集 、 游 记 文本 预 处 理 、 情 感 标注 、 按 时 间 
段 统计 游记 情感 特征 分 值 、 游 记 情感 时 间 特 征 分 析 。 并 从 网 络 抓 取 4 种 类 型 旅游 地 游记 对 模型 进行 实验 。[ 结果 】 
在 7 类 情感 中 , [好 ] 的 情感 均值 在 各 旅游 地 的 各 月 份 中 总 是 远 高 于 其 他 情感 ， 较 为 稳定 ; [好 ]、[ 乐 ] 和 [ 恶 ] 在 不 同月 
份 的 波动 程度 较 大 ; 情感 随时 间 的 波动 与 相应 游记 数量 并 不 相关 ， 即 传统 的 旅游 地 旺季 和 淡季 的 划分 与 游客 的 
实际 情感 体验 并 不 相关 。[ 结论 】 该 模型 能 够 有 效 地 反映 旅游 地 的 游客 情感 随时 间 变 化 的 波动 , 进而 为 旅游 管理 
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者 、 潜 在 旅游 者 信息 绪 取 提供 新 的 信息 参考 渠道 。 


关键 词 : 网 络 游记 ”情感 分 析 “情感 词典 “时间 特 征 
分 类 号 : G350 
1 引言 

由 于 旅游 地 景点 的 季节 波动 以 及 旅游 旺 淡季 人 流 


量 或 服务 质量 不 平衡 都 会 影响 到 游客 的 情感 ， 因 此 不 
同时 间 段 的 旅游 体验 不 一 样 ,游客 对 旅游 地 的 情感 倾 
向 也 会 有 所 变化 。 随 着 社会 媒体 的 发 展 ， 越 来 越 多 旅 
游 者 通过 网 络 游记 分 享 旅游 体验 , 表达 自己 对 旅游 地 
的 意见 及 情感 倾向 。 网 络 游记 数据 提供 了 游记 文本 及 
旅游 出 发 时 间 信 息 , 能 准确 反映 出 在 不 同时 间 段 游客 
对 旅游 地 的 意见 及 情感 倾向 。 而 针对 网 络 游记 进行 基 
于 时 间 特 征 的 分 析 , 结合 细致 的 情感 分 类 ,可 发 现 游 
客 各 类 情感 随时 间 变 化 的 规律 , 选取 关键 性 情感 指标 ， 
一 方面 能 为 旅游 地 管理 者 提供 新 的 信息 源 ， 发 现 积极 
情感 强烈 但 游客 数量 不 多 的 时 间 段 ， 从 而 调整 宣传 策 
略 ;而 为 了 让 游客 在 网 络 上 传播 旅游 地 积极 的 口碑 , 旅 
游 地 管理 者 可 发 现 消极 情感 强烈 的 时 间 段 ， 进 而 优化 
该 时 间 段 的 旅游 资源 分 配 。 另 一 方面 , 可 以 为 潜在 旅 
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游 者 提供 根据 不 同时 间 段 的 游客 情感 倾向 的 旅游 地 检 
索 新 渠道 ， 满足 更 多 元 的 检索 需求 ,让 潜在 旅游 者 可 
以 根据 自身 的 旅游 期 望 选择 最 佳 的 旅游 地 和 旅游 时 间 
的 组 合 。 

本 文 利用 基于 情感 词典 的 情感 分 析 方 法 ， 对 游客 
发 表 的 网 络 游记 进行 情感 标注 ,通过 分 析 不 同时 间 段 
游记 的 情感 波动 情况 ,发 现 游客 对 旅游 地 情感 倾向 随 
时 间 变 化 的 规律 ,进而 为 旅游 管理 者 、 潜 在 旅游 者 信 
息 获 取 提 供 新 的 信息 参考 渠道 。 


2 相关 研究 


情感 分 析 又 称 意见 挖掘 ,是 指 通过 对 用 户 发 表 的 
内 容 文 本 进行 主客 观 性 观点 、 人 情绪、 极 性 的 分 析 和 挖 
P, 判断 出 文本 的 情感 倾向 分 类 中 ,情感 分 析 的 方法 主 
要 分 为 两 大 类 : 基于 情感 词典 的 方法 和 基于 机 带 学 习 
的 方法 。 

(1) 基于 情感 词典 进行 情感 分 析 , 要 构建 一 个 能 
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准确 判断 情感 词 所 属 的 类 别 及 情感 值 的 情感 词典 , 情 
感 词典 的 质量 对 情感 分 析 的 效果 影响 很 大 。Hu gU! 
通过 WordNet 得 到 情感 词 及 其 情感 极 性 ,根据 句子 正 
负 情 感 分 的 离 差 决定 该 句子 的 情感 倾向 。 在 中 文 领域 
H, REREH HowNet 进行 语义 相似 度 和 语义 
相关 场 的 计算 , 提出 两 种 词汇 情感 倾向 性 计算 方法 ， 
判别 准确 率 高 。 史 伟 等 外 构建 了 模糊 情感 词 本 体 ,进行 
微 博 的 情感 计算 , 得 到 公众 对 突 发 事件 的 情感 曲线 。 

(2) 基于 机 带 学 习 的 情感 分 析 可 归结 为 文本 分 类 
问题 ， 常 用 的 机 器 学 习 模 型 有 : 朴素 贝 叶 斯 Naive 
Bayes), fx XJ4j(Maximum Entropy), FÒM EN, 
K 最 近邻 分 类 和 支持 向 量 机 (SVM)。Pang 等 分别 使 
用 朴素 贝 叶 斯 、 最 大 炉 、 支 持 向 量 机 三 种 方法 对 电影 
评论 进行 情感 倾向 性 分 类 ,发 现 支 持 向 量 机 方法 的 分 
类 效果 最 佳 , 精准 度 可 达 80%。 在 中 文 领域 中 , 徐 军 等 四 
以 新 闻 及 评论 为 语 料 , 采用 朴素 贝 叶 斯 和 最 大 燃 方 法 
进行 情感 分 类 ,发 现在 多 数 情 况 下 最 大 炉 方 法 的 准确 
率 高 于 贝 叶 斯 方法 。 

情感 分 析 在 旅游 领域 的 应 用 主要 在 旅游 服务 评论 
以 及 景点 评论 上 。 在 旅游 服务 评论 方面 Banić gU i] 
用 KNIME 对 酒店 的 在 线 评论 进行 情感 分 析 , 得 到 酒 
店 某 一 特征 的 情感 分 值 及 酒店 整体 情感 倾向 , 为 潜在 
客户 提供 决策 参考 , 也 为 酒店 管理 人 员 指 明 改 进 方 
向 。 在 旅游 目的 地 景点 评论 方面 , 王 素 格 等 外 利用 词 对 
间 的 依存 关系 ,设计 具有 情感 倾向 的 “特征 -观点 ?对 
抽取 算法 ,并 对 山西 旅游 景点 评论 进行 “特征 -观点 ” 
对 的 抽取 , 有 效 挖掘 游客 的 观点 信息 。 郑 文英 中 面向 旅 
行 目的 地 在 线 评论 信息 ， 基 于 逐 点 语义 分 析 法 提取 情 
感 倾向 词组 ， 从 三 大 方面 分 析 游 客 反映 的 关于 旅游 地 
的 问题 , 并 提出 建议 。 

游客 对 旅游 地 的 情感 不 仅 因 人 而 异 , 也 因 时 而 
异 。 金 程 1" 通 过 半 结 构 化 日 记 发 现 游客 在 不 同 旅游 阶 
段 的 情感 强度 呈 动 态 变化 。 胡 传 东 总 利用 ROST CM6 
对 骑 行 游记 进行 情感 分 析 , 并 根据 情感 倾向 的 起 伏 变 
化 规律 , Te git gs rp esae UE. TRU T 
建 基于 微 博大 数据 的 游客 情感 分 析 模 型 ， 对 西安 市 区 
内 的 用 户 微 博 进行 情感 分 析 , 分 析 了 游客 情感 的 时 间 
变化 特征 。Li 等 中 研究 并 设计 了 一 个 用 于 旅游 网 络 观 
点 的 视觉 分 析 系 统 VisTravel, 通过 对 网 络 游记 及 评论 
的 情感 分 析 , 能 有 效 展示 游客 情感 随时 间 的 变化 。 


数据 分 析 与 知识 发 现 
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应 用 认 


情感 分 析 在 旅游 领域 仍 有 较 大 研究 和 应 用 空间 。 
目前 研究 多 数 仅 基 于 文本 情感 二 元 划分 方法 , 分 为 积 
极 和 消极 情感 ， 且 多 以 分 析 旅 游 服务 评论 为 主 。 与 之 
相 比 , 本 研究 将 时 间 特 征 引入 到 游客 对 旅游 目的 地 情 
感 倾 向 的 研究 中 ,使 用 更 为 细致 的 文本 情感 分 类 , 构 
建 面 向 网 络 游记 时 间 特 征 的 情感 分 析 模 型 ， 因此 能 够 
更 好 地 反映 游客 对 旅游 目的 地 情感 的 时 间 变 化 规律 。 


3 面向 网 络 游记 时 间 特 征 的 情感 分 析 模 型 


通过 相关 研究 发 现 ， 当 前 在 旅游 领域 的 情感 分 析 
主要 基于 旅游 产品 或 旅游 服务 的 用 户 评论 , 本 文 认为 
可 以 对 网 络 游记 进行 深入 挖掘 ,引入 时 间 特 征 , 发 现 
游客 情感 随时 间 的 变化 特征 ， 从 而 能 结合 时 间 维 度 为 
潜在 旅游 者 提供 旅游 决策 参考 ,同时 有 助 于 为 旅游 地 
提供 全 年 不 同时 间 段 的 旅游 产品 策划 、 营 销 策略 等 建 
议 。 本 文 提 出 的 面向 网 络 游记 时 间 特 征 的 情感 分 析 模 
型 是 基于 网 络 游记 的 文本 内 容 , 对 网 络 游记 文本 进行 
情感 分 析 ， 研 究 游 客 对 旅游 目的 地 情感 的 时 间 特 征 变 
化 , 该 情感 分 析 模 型 如 图 1 所 示 。 

面向 网 络 游记 时 间 特 征 的 情感 分 析 人 处 理 过 程 ， 可 
以 分 为 5 大 模块 : 采集 网 络 游记 数据 、 对 游记 文本 进 
行 预 处 理 、 情 感 标 注 、 计 算 游 记 的 情感 特征 分 值 、 游 
记 的 情感 时 间 特 征 结果 分 析 。 

(1) 采集 网 络 游记 文本 内 容 及 旅游 时 间 数 据 。 先 
设 定 实验 数据 的 时 间 范 围 以 及 旅游 目的 地 , 再 利用 网 
络 疏 虫 采集 符合 以 下 特征 的 游记 数据 : 数据 要 素 齐 全 
(旅游 目的 地 、 标 题 、 出 游 时 间 、 文 本 内 容 ); 游记 显示 
的 出 游 时 间 在 选 定 的 时 间 段 内 。 

(2) 游记 文本 预 处 理 。 采 集 的 部 分 游记 会 存在 描 
写 多 个 旅游 地 的 情况 ,可 能 导致 目标 旅游 地 的 情感 
倾向 性 不 同 。 因 此 , 为 了 提高 情感 的 目标 指向 性 ， 降 
低 同 游 的 旅游 地 对 目标 旅游 地 情感 的 影响 ,要 对 游 
记 数 据 进行 预 处 理 , DRE As TR COUR HI Qf TCR 
jg. 再 进行 信息 提取 ， 主 要 提取 游记 标题 、 出 游 时 间 、 
文本 内 容 等 作为 信息 元 ,存储 到 数据 库 中 , 作为 实验 
数据 集 。 

(3) 情感 标注 。 构建 适用 的 情感 词典 ,将 情感 词典 
中 的 情感 词 逐一 与 实验 数据 集中 的 游记 文本 内 容 匹 
配 ， 记 录 下 游记 中 出 现 该 情感 词 的 位 置 。 由 于 文章 中 
会 存在 否定 句 ， 对 句子 或 文章 进行 情感 类 别 识别 时 ， 
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游记 的 情感 特征 分 值 


1 面向 网 络 游记 时 间 特 征 的 情感 分 析 模 型 


还 需 考 虑 是 否 存 在 影响 情感 类 别 的 否定 词 。 因 此 , 先 
识别 情感 词 在 情感 词典 中 所 属 类 别 以 及 其 对 应 的 情感 
强度 , 再 判断 抽取 的 情感 词 前 是 否 存 在 否定 词 , 若 存 
在 否定 词 ， 则 进行 相应 的 情感 迁移 ,最 后 记录 下 识别 
到 的 情感 类 别 及 其 强度 。 


Tar 
o 


以 期 发 现 基于 时 间 特 征 的 各 个 旅游 地 的 情感 规 得 
4.1 网 络 游记 数据 采集 及 预 处 理 

为 使 研究 结果 更 具有 代表 性 , 本 研究 选择 4 个 分 
布 在 不 同 区域 且 各 具 特 色 的 旅游 城市 , 分 别 是 东北 资 
源 型 的 哈尔滨 、 自 然 景 观 型 的 黄山 、 都 市 观光 型 的 重 


(4) 按时 间 段 统计 游记 的 情感 特征 分 值 。 对 游记 
文本 中 识别 到 的 所 有 情感 类 型 及 其 强度 进行 汇总 , 分 
别 计算 该 游记 文本 中 各 种 情感 类 别 的 强度 之 和 ,从 而 
计算 出 该 篇 游记 文本 中 各 种 情感 类 别 的 平均 分 值 。 再 
选择 一 个 合适 的 时 间 单 位 (季度 或 月 份 或 星期 等 ) 对 
全 年 中 各 个 时 间 段 的 所 有 游记 文本 中 各 种 情感 类 别 的 
SA HBIETT EDI, 得 到 各 个 时 间 段 整体 游记 的 不 同 
情感 类 别 的 情感 分 值 ,从 而 计算 出 各 个 时 间 段 内 整体 
游记 的 不 同情 感 类 别 的 情感 平均 分 值 。 

(5) 游记 的 情感 时 间 特 征 分 析 。 对 得 到 的 不 同 旅 
游 地 的 情感 数据 进行 分 析 , 得 到 不 同时 间 段 游记 的 情 
感 波动 情况 ,发 现 游客 对 旅游 地 情感 倾向 随时 间 变 化 
的 规律 ,进而 为 旅游 管理 者 、 潜 在 旅游 者 信息 获取 提 
供 新 的 信息 参考 渠道 。 


4 面向 网 络 游记 时 间 特 征 的 情感 分 析 实 验 


为 验证 模型 的 有 效 性 ， 本 文 从 蚂 蜂 窝 网 "采集 相 
关 的 游记 数据 , 通过 对 典型 的 不 同类 型 旅游 地 的 分 析 ， 


庆 以 及 南方 海滨 型 的 三 亚 。 选 用 疏 虫 工具 “火车 采集 
器 扣 抓 取 了 蚂 蜂窝 0 上 的 网 络 游记 数据 作为 情感 分 
析 的 实验 数据 集 ， 数 据 采 集 时 间 为 : 2016 年 11 月 。 实 
验 数据 时 间 范 围 设 定 在 2013 4F. 1 H 1 H 28 2015 4E 12 
月 31 H, 采集 到 哈尔滨 游记 1 347 篇 .黄山 游记 1 671 
篇 、 重 庆 游 记 1 916 篇 、 三 亚 游 记 2 349 篇 。 由 于 采集 
的 游记 中 存在 描写 多 个 旅游 地 的 情况 ,为 了 保证 情感 
分 析 的 准确 度 ， 对 数据 中 包含 不 同 旅游 地 的 游记 进行 
剔除 。 最 终 得 到 哈尔滨 游记 821 篇 、 黄 山 游 记 969 篇 、 
重庆 游记 1234 篇 和 三 亚 游记 2 183 篇 。 将 采集 到 的 网 
络 游记 数据 中 出 现 的 旅游 目的 地 、 游 记 内 容 及 对 应 的 
旅游 时 间 进 行 结构 化 抽取 , 存 人 数据 库 中 。 
4.2 ”情感 标注 

(1) 选择 情感 词典 

与 基于 机 器 学 习 的 方法 相 比 ， 基 于 词典 的 倾向 性 
评分 方法 则 简单 且 高 效 ,适合 工程 应 用 , 但 此 方法 的 
效果 受 情 感 词典 的 质量 影响 较 大 "9。 目 前 , 在 中 文 领 
域 ， 主 要 选用 的 情感 词典 有 知 网 的 情感 分 析 用 词语 集 
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(HowNeb "台湾 大 学 中 文通 用 情感 词典 (NTUSD) 以 
及 中 文 情感 词汇 本 体 库 ”。 

本 文选 用 2012 年 大 连理 工大 学 信息 检索 研究 室 
发 布 的 中 文 情感 词汇 本 体 库 作为 情感 词典 。 该 词典 将 
情感 共 分 为 乐 、 好 、 怒 、 户 、 惧 、 恶 、 惊 7 大 类 , 包 
含 27 352 个 中 文 情感 词汇 。 

(2) 情感 标注 过 程 

将 中 文 情感 词汇 本 体 库 中 的 情感 词 逐一 与 实验 数 
据 集中 的 游记 文本 内 容 进 行 匹 配 ， 得 到 该 情感 词 在 该 
游记 中 出 现 的 位 置 。 对 于 游记 中 情感 词 被 否定 词 修饰 
的 情况 , 采用 杜 振 雷 (提出 的 否定 词 修饰 后 情感 迁移 
的 方法 。 若 情感 词 前 的 $ 个 字符 中 存在 否定 词 , 则 进 
行 相应 的 情感 迁移 , 最 后 记录 下 识别 到 的 情感 类 别 及 
其 强度 ， 再 进行 下 一 个 情感 词 的 匹配 。 

例如 ,“ 说 实话 , 饺子 和 面条 都 不 怎么 好 吃 , 要 不 
是 醋 和 辣椒 , 我 都 吃 不 下 去 ”中 出 现 情感 词 “好 吃 ”， 根 
据 中 文 情感 词汇 本 体 库 查 到 属于 情感 大 类 中 的 [好 ]， 
表示 对 食物 的 赞扬 , 情感 强度 为 3。 由 于 在 “好 吃 ” 前 出 
现 了 否定 词 “ 不 ”， 因 此 进行 情感 迁移 , 情感 迁移 为 
[X], 情感 强度 被 减弱 ， 降 为 0.6。 

43 ”计算 情感 特征 分 值 

本 文 面向 网 络 游记 文本 对 每 类 情感 都 提取 两 个 情 
感 特征 指标 , 分 别 是 单个 月 份 中 网 络 游记 的 情感 均值 
和 各 种 情感 在 月 份 上 的 情感 标准 差 。 单 个 月 份 中 网 络 


份 Mon; 中 所 有 网 络 游记 [ 乐 ] 的 情感 均值 进行 平均 , 得 
到 月 份 Mon; [ 乐 ] 的 情感 均值 ， 表示 为 MondvgJoy, 如 
公式 (1) 所 示 。 


Y AvgJoy, 
MonAvgJoy;. ££— ——— " (1) 

其 中 ，AveJoyi 为 月 份 Mon; 中 的 网 络 游记 D, R] 
的 情感 分 均值 ， 即 网 络 游记 D, 中 情感 类 别 为 [ 乐 ] 的 情 
感 词 的 情感 强度 之 和 与 该 游记 中 7 类 情感 词 次 数 之 和 
的 商 。7 为 月 份 Mom 中 网 络 游记 的 篇 数 。 

Q) 各 类 情感 在 各 月 份 的 情感 均值 标准 差 能 
映 游客 情感 在 各 月 份 的 波动 程度 ,使 用 标准 差 公 式 中 1 
计算 各 个 月 份 [ 乐 ] 的 情感 标准 差 , 能 较 准确 地 反映 
[ 乐 ] 的 情感 在 各 月 份 的 波动 程度 , WA St4Joy， 如 公 
式 (2) 所 示 。 


12 12 
X (MonScoJoy, 一 5 X MonScoJoy, y 
StdJoy- = (2) 


i 
12 
其 中 , MonScoJoy; 为 月 份 Mon; [ 乐 ] 的 情感 分 值 。 


5 实验 结果 分 析 


根据 第 4 节 的 处 理 方法 对 实验 数据 集中 的 网 络 游 
记 内 容 文本 进行 情感 分 析 , 得 到 哈尔滨 、 黄 山 、 重 庆 、 
三 亚 这 4 个 不 同类 型 旅游 地 的 情感 特征 数据 。 在 这 些 


游记 的 情感 均值 反映 了 以 该 月 份 所 有 的 网 络 游记 为 整 
体 的 情感 倾向 , 各 种 情感 在 月 份 上 的 情感 标准 差 表现 
了 情感 随 月 份 的 波动 程度 。 

由 于 每 篇 网 络 游记 都 包含 情感 词 , 因此 均 为 主 
观 文本 ,可 进行 情感 特征 的 量化 。 将 网 络 游记 文本 表 
示 为 篇 章 集 D-(Di, D», *5, Dy, 按 月 份 分 别 对 7 类 
情感 进行 情感 特征 分 值 计 算 。 由 于 每 类 情感 的 计算 方 
法 相同 , 下 面 以 “ 乐 ”(Joy) 为 例 介绍 情感 特征 分 值 的 
计算 方法 。 

(1) 情感 均值 能 去 除 网 络 游记 篇 数 的 影响 ， 较 准 
确 地 反映 单个 月 份 中 网 络 游记 整体 的 情感 特征 。 对 月 


CDhttp://www.keenage.com/html/c index.html. 
Qhttp://nlg18.csie.ntu.edu.tw: 8080/opinion/index.html. 
G)http://ir.dlut.edu.cn/EmotionOntologyDownload. 
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数据 的 基础 上 ， 对 各 旅游 地 网 络 游记 数量 的 时 间 分 布 
情况 以 及 各 旅游 地 网 络 游记 情感 时 间 变 化 情况 进行 分 
Pr, 从 中 可 以 发 现 游客 情感 的 时 间 特 征 规律 进而 为 
旅游 管理 者 、 潜 在 旅游 者 信息 获取 提供 新 的 信息 参考 
渠道 。 
5.1 网 络 游记 数量 的 时 间 分 布 

从 网 络 游 记 文 本 内 容 中 提取 出 明确 的 出 游 时 间 ， 
得 到 各 月 份 游 记 的 数量 , 在 一 定 程度 上 能 反映 出 当地 
的 游客 数量 情况 。 哈 尔 滨 、 黄 山 、 重 庆 、 三 亚 旅游 人 
数 的 时 间 变 化 情况 ,如 图 2 所 示 。 
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-—e- 哈尔滨 一 黄山 ”一 -重庆 一 三亚 
图 2 2013 年 -2015 年 各 城市 各 月 份 的 网 络 游 记 篇 数 
从 整体 看 各 旅游 地 游客 的 月 度 变 化 , 发 现 9 月 、 
10 月 出 游人 数 相 对 较 多 , 11 H 、12 月 较 少 , 与 我 国法 
定 假期 放假 情况 相对 应 ,不 同 旅游 地 最 高 点 的 月 份 不 
完全 相同 ,随时 间 变 化 趋势 不 一 样 ,说 明 游 客 会 根据 
不 同月 份 计划 出 游 的 旅游 地 。 整 体 分 布 上 , 各 旅游 地 
的 网 络 游记 分 布 情况 区 别 很 大 。 其 中 , 游记 数量 最 多 
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的 是 9 月 份 的 三 亚 ,， 多 达 274 篇 ,可见 9 月 的 三 亚 极 
其 受 游客 欢迎 。 游 记 数 量 最 少 的 是 4 月 份 的 哈尔滨 ， 
只 有 21 篇 ,而 12 月 份 的 哈尔滨 , 高达 191 篇 ， 可见 
哈尔滨 游客 数量 随时 间 波 动 很 大 , 冬季 之 外 的 哈 尔 
滨 对 游客 吸引 力 不 足 。 黄 山 和 重庆 的 游记 数量 分 布 
相似 ,， 均 呈 “M" 字 型 ， 春 秋 两 季 为 旅游 旺季 , 与 当地 
气候 关系 密切 。 相 比 之 下 , 三 亚 的 游记 数量 分 布 都 
比较 高 ， 只 有 11 月 、12 月 相对 偏 低 ， 说 明 旅 游 开 发 
较 成 熟 。 
5.2. ”旅游 地 网 络 游记 情感 的 时 间 变 化 分 析 

以 月 为 时 间 单位 对 游客 情感 的 时 间 特 征 规律 进行 
探索 。 

(1) 各 类 情感 的 情感 均值 范围 

对 各 旅游 目的 地 游客 的 网 络 游记 情感 变化 情况 绘 
制 情感 变化 折线 图 , 如 图 3 所 示 。 
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图 3 2013 年 -2015 年 各 城市 各 月 份 的 网 络 游记 情感 均值 


从 图 3 整体 可 以 看 到 东北 资源 型 的 哈尔滨 、 自 然 
景观 型 的 黄山 、 都 市 观光 型 的 重庆 以 及 南方 海滨 型 的 
三 亚 这 4 个 不 同类 型 的 旅游 地 情感 月 度 变 化 情况 。[ 好 ] 
的 情感 均值 在 各 旅游 地 中 都 分 布 较 高 ， 其 次 是 [ 乐 ] 和 


[X], 都 在 1 上 下 浮动 , 其 他 4 种 情感 在 0.5 以 下 。[ 好 ] 
的 情感 包括 尊敬 、 赞 扬 、 喜 爱 、 视 愿 等 , 说明 游客 对 
旅游 地 的 总 体感 受 倾向 于 喜爱 与 赞扬 ， 达 到 了 其 对 旅 
游 度 假 的 期 望 ， 同 时 反映 了 游客 写 网 络 游记 时 对 旅游 
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地 的 回忆 多 为 美好 的 , 对 积极 情感 的 描写 较 多 , 旅游 
地 能 通过 游客 在 网 络 上 传递 比较 好 的 口碑 。 

因此 ,网络 游 记 情感 的 时 间 变 化 特征 一 可 归纳 为 : 

在 7 类 情感 中 , [好 ] 的 情感 均值 在 各 旅游 地 的 各 月 份 中 


i 


m 
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总 是 最 高 , 远 高 于 其 他 情感 ， 且 较为 稳定 。 

(2) 情感 随时 间 的 波动 程度 

对 各 城市 网 络 游 记 情感 均值 标准 差 进行 计算 , 结 
果 如 图 4 所 示 。 


mik 利好 cf sx: amd omi ampi 


图 4 2013 年 -2015 年 各 城市 网 络 


各 旅游 地 的 情感 标准 差分 布 情况 类 似 , 情感 [好 ]、 
[ 乐 ] 和 [有 恶 ] 的 标准 差 在 各 旅游 地 中 都 较为 明显 ， 而 
[ 怒 ]、[ 训 ]、[ 惧 ]、[ 惊 ] 的 标准 差 相 对 较 小 。 这 说 明 在 
分 析 游客 对 旅游 地 情感 的 时 间 变 化 规律 时 ，7 类 情感 
的 表达 能 力 相 差 较 大 。 

由 此 总 结 得 到 网 络 游记 情感 的 时 间 变 化 特征 二 
为 : 在 7 类 情感 中 , 情感 [好 ] [ 乐 ] 和 [ 恶 ] 在 不 同月 份 的 
波动 程度 较 大 , HEL PUR]. Det]. DT. 、[ 惊 ] 的 波动 
很 小 。 

(3) 情感 随时 间 的 波动 情况 与 游记 数量 变化 之 间 
的 关系 

考虑 [好 ]、[ 乐 ]、[ 恶 ] 这 三 种 明显 波动 的 情感 能 
一 定 程度 上 反映 不 同月 份 游客 的 情感 变化 情况 ， E 
针对 各 个 旅游 地 的 这 三 种 情感 在 时 间 上 的 变化 进行 分 
析 。 以 哈尔滨 为 例 ， 对 [好 ]、[ 乐 ] 和 [ 亚 ] 的 情感 均值 及 
游记 数 进行 分 析 ，, 如 图 5 所 示 。 
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图 5 2013 年 -2015 年 哈尔滨 网 络 游记 情感 
均值 与 游记 数 
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多 游记 情感 均值 在 各 月 份 的 标准 差 


游客 对 旅游 地 情感 波动 与 游记 数量 分 布 存在 较 大 
差异 。12 月 份 是 哈尔滨 最 受 游客 欢迎 的 月 份 , 人 流量 
最 多 , 却 不 是 游客 积极 情感 最 强烈 的 月 份 。 存 在 游客 
积极 情感 强烈 , 但 游客 人 数 不 多 的 月 份 ， 表现 出 这 个 
月 份 旅游 地 的 发 展 潜力 。 

由 此 总 结 得 到 网 络 游记 情感 的 时 间 变 化 特征 三 
为 : 网 络 游记 情感 随时 间 的 波动 与 相应 的 游记 数量 并 
不 相关 ， 即 传统 的 旅游 地 旺季 和 淡季 的 划分 与 游客 的 
实际 情感 体验 并 不 相关 。 

从 上 文 分 析 可 知 , 情感 [好 ]、[ 乐 ] 和 [有 亚 ] 在 不 同月 
份 的 波动 程度 较 明显 。 因 此 , 选取 东北 资源 型 的 代表 
旅游 地 哈尔滨 和 南方 海滨 型 的 代表 旅游 地 三 亚 ， 从 
[好 ] [ 乐 ] 和 [ 恶 ] 情 感 进行 时 间 变 化 因素 分 析 。 情感 [好 ] 
表达 了 游客 对 旅游 地 的 尊敬 、 赞 扬 、 相 和信、 喜爱 和 视 
愿 ， 而 [ 乐 ] 表 达 了 游客 快乐 .安心 的 情感 , [ 恶 ] 则 表现 了 
WEAOSREURAR Au. NX. Wrvt. WRUURMASE. h 

于 情感 [好 ] 的 均值 远大 于 [ 乐 ] 和 [ 恶 ], 为 更 清晰 地 显示 
三 种 情感 的 变化 趋势 ,将 其 分 为 两 组 绘制 折线 图 如 
图 6 和 图 7 所 示 。 

东北 资源 型 的 哈尔滨 情感 波动 情况 比 南方 海滨 型 
的 三 亚 更 显著 , 说 明 不 同类 型 旅游 地 的 游客 情感 随时 
间 变 化 , 特征 存在 差异 ,东北 资源 型 旅游 地 的 游客 在 1 
、7 月 、11 月 、12 月 的 积极 情感 [好 ] 和 [ 乐 ] 较 高 ， 即 
冬季 节 , 说 明 东 北 资源 型 旅游 地 具有 夏季 可 避暑 ， 
冬天 能 玩 冰 雪 的 特点 ,能 满足 游客 的 预期 。 但 同时 冬 
季 [ 恶 ] 的 情感 很 高 ,旅游 地 可 以 从 冬季 月 份 的 游记 中 
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图 6 哈尔滨 2013-2015 年 各 月 份 网 络 游 记 情 感 均值 
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图 7 三 亚 2013 年 -2015 年 各 月 份 网 络 游记 情感 均值 


挖掘 游客 产生 [ 恶 ] 情 感 的 原因 ， 提 高 旅游 服务 。 而 4 
月 .5 月 份 情感 [好 ] 和 [ 乐 ] 都 低 于 平均 值 ,2 月 .3 月 [好 ] 
和 [ 乐 ] 情 感 一 般 ， 而 [ 恶 ] 情 感 上 升 ， 说 明 东 北 资源 型 
旅游 地 缺乏 对 春季 旅游 产品 开发 ， 让 游客 失望 而 归 。 

与 之 相 比 ,南方 海滨 型 的 三 亚 [好 ] 的 情感 均值 全 
年 的 平均 值 为 2.47, 高 于 哈尔滨 ， 且 情感 波动 没有 哈 
尔 滨 大 , 说 明 游客 在 三 亚 的 体验 普遍 比 哈尔滨 好 ， 旅 
游 发 展 更 稳定 成 熟 。 由 图 7 可 见 , 三 亚 5 月 -6 月 [好 ] 
和 [ 乐 ] 情 感 都 下 降 ，[ 恶 ] 情 感 明显 上 升 。 对 于 南方 海滨 
型 的 旅游 地 , 5 月 -6 月 天 气 炎热 ,而 且 常常 伴随 着 台风 
下 雨 ,对 游客 旅游 体验 的 有 很 大 影响 。12 月 [好 ] 和 [ 乐 ] 
情感 都 很 高 ,对 于 喜欢 嬉戏 游玩 的 游客 ,推荐 选择 
[ 乐 ] 情 感 高 的 10 月 -12 月 期 间 出 游 ,而 偏好 休闲 观光 
的 游客 ,选择 [好 ] 情 感 高 的 4 月 、7 月 、8 月 、12 月 期 
间 旅 游 。 


6 结语 


网 络 游记 正在 成 为 一 种 旅游 方面 重要 的 信息 来 
源 ， 一 方面 为 潜在 旅游 者 提供 参考 , 另 一 方面 为 商家 
提供 商机 。 本 文 从 时 间 层 面 对 旅 游资 源 进行 分 析 , 提 
出 面向 网 络 游记 时 间 特 征 的 情感 分 析 模型 ,该 模型 主 


要 包括 网 络 游记 文本 内 容 及 旅游 时 间 数 据 的 采集 、 游 
记 文 本 预 处 理 、 情 感 标 注 、 按 时 间 段 统计 游记 情感 4 
征 分 值 、 游 记 情感 时 间 特 征 的 结果 分 析 5 大 模块 。ii 
模型 从 时 间 维 度 上 分 析 游 客 对 旅游 地 情感 变化 规律 ， 
基本 规律 如 下 : 

(1) 在 7 类 情感 中 , [好 ] 的 情感 均值 在 各 旅游 地 的 
各 月 份 中 总 是 最 高 , 远 高 于 其 他 情感 ， 较 为 稳定 。 

(2) 在 7 类 情感 中 , 情感 [好 ] [ 乐 ] 和 [ 恶 ] 在 不 同月 
份 的 波动 程度 较 大 , DS]. Det]. [ 悍 ]、[ 尺 ] 的 波动 很 小 。 

(3) 情感 随时 间 的 波动 与 相应 游记 数量 并 不 相关 ， 
即 传统 的 旅游 地 旺季 和 淡季 的 划分 与 游客 的 实际 情感 
体验 并 不 相关 。 
通过 对 4 个 不 同类 型 旅游 地 的 游记 进行 分 析 , 发 
现 符合 以 上 规律 。 对 于 旅游 地 [好 ] 和 [ 乐 ] 情 感 强度 都 高 
于 平均 值 的 月 份 , 游客 对 旅程 体验 的 满意 度 比较 高 ， 
旅游 资源 具有 很 大 的 开发 空间 。 对 于 [ 亚 ] 较 高 的 月 份 ， 
不 推荐 给 旅游 者 ,建议 旅游 地 管理 者 对 该 时 段 游客 游 
记 进行 内 容 分 析 ， 了 解 游 客 厌恶 的 原因 ,并 采取 相关 
改善 措施 。 对 于 游客 积极 情感 强烈 , 但 游客 人 数 不 多 
的 月 份 , 建议 潜在 游客 可 选择 在 该 月 份 前 往 旅游 。 
此 应 用 该 模型 能 通过 分 析 不 同时 间 段 游记 的 情感 波动 
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情况 ,发 现 游客 对 旅游 地 情感 倾向 随时 间 变化 的 规律 ， 
进而 为 旅游 管理 者 、 洪 在 旅游 者 信息 获取 提供 新 的 信 
息 参 考 渠 道 。 

本 文 不 足 之 处 在 于 通过 游记 的 方式 能 获得 丰富 的 
HB, 但 其 中 可 能 会 存在 部 分 情感 表达 不 充分 的 情况 ， 
如 对 旅游 地 很 不 满 的 游客 很 少 会 发 表 游记 。 在 后 续 的 
研究 中 将 考虑 加 入 其 他 类 型 的 信息 来 源 进行 分 析 ， 进 
一 步 完善 旅游 地 情感 时 间 特 征 的 规律 , 使 研究 结论 更 
具有 参考 价值 。 
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A Sentiment Analysis Model Based on Temporal Characteristics of 
Travel Blogs 


Cheng Cuiqiong Xu Jian 
(School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China) 


Abstract: [Objective] This study aims to find the temporal-distribution patterns of tourists! attitudes towards their 
destinations through sentiment analysis of travel blogs. [Context] More and more tourists collect information on their 
destinations from travel blogs, which provide enormous business opportunities. [Methods] We proposed a sentiment 
analysis model based on temporal characteristics of travel blogs. It includes the following modules: data collection, 
preprocessing, identifying sentiment words, weight calculation, and analysis. The model was examined with four types 
of travel blogs. [Results] The number of post with “good” emotion was always higher than others each month. The 
volatility of “good”, "happiness" and “disgust” emotion was the highest in different months. The volatility emotion over 
time was not correlated to the number of related travel blogs. There is no relationship between the peak/off seasons and 
the emotion of tourists. [Conclusions] The proposed model could identify the changing of tourist sentiment over time, 
which provides new information for tourism managers and potential visitors. 
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